Verónica
Trabajo de Ingenieria Genetica de Microorganismos
Secuencia #9


Trabajo poco elaborado, bibliografía escasa y no citada en el texto. Los nombres de especies se escriben en cursiva, el nombre específico en minusculas. Con la informacion suminstrada no puedo ver si la secuencia ha sido bien anotada.No le considero la ortografía por motivos obvios.


RESUMEN
En este trabajo tenemos una sequencia de 17.000 nt.
Despues de una analisis de esta secuencia en BLAST vemos su apartenencia a Rhodococcus Opacus B4 y tambien similaridades con Rhodococcus erythropolis PR4Esplicaremos entonces la funciòn y algunas caracteristicas de una proteina en la secuencia de nucleotidos data.La secuencia proviene de Rhodococcus Opacus B4, una bacteria gram + de altro contenido en G+C (65%), pertenecen a el orden Actinomycetales, suborden Corynebacterineae y familia Nocardiaceae.Rhodococcus opacus B4 es aislado como una bacteria de la gasolina. Los membros de Rhodococcus estan presentes en varios ambientes como el suelo al mar y tambien presentan una grande versatilidad metabolica. Caracteristica de Rhodococcus es la capacidad de degradar una gran variedad de compuestos de carbono. Rhodococcus opacus utiiza varios hydrocarburos aromaticos como el benzene, el toluene, xylene, ethylbenzene, propylbenzene y otros.
El cromosoma de Rhodococcus opacus es linear, presenta dos plasmidos lineares y tres circulares, el genoma codifica para genes implicados en la degradacion de varios compuestos organicos como el paphtalene, indene, nicotina, thiocyanato.

INTRODUCCION
Los ORFs que encontramos en la secuencia analizada mediante el programa ARTEMIS son relativos a las siguientes proteinas o proteinas hypoteticas:
CDS 1795-3747 proteina hypotetica ROP 38750 (Rhodococcus Opacus), CDS 3858-4394 proteina hypotetica SACE_0358, CDS 5181-5747 proteina hypotetica ROP_38670, CDS 5748-7355
mooxygeanasa flavin-containing, CDS 7356-8024 hypotetica proteina RER_01370, CDS 14777-15688 hypotetica proteina RER_ (elenco proteine)La proteina che56360, CDS 14418-15050 proteina heme-binding, CDS 157-903 proteina hypotetica RER_01310, CDS 4441-5331 3-hydroxiacyl-CoA dehydrogenasa,CDS 1195-12543 proteina
hypotetica RER_54480, CDS 12544-13206NArI family two-component responde regulator, CDS 16552-16998 probable amidasa, CDS 854-1831 hypotetica proteina de membrana, CDS 10232-10612
proteina hypotetica RER_40260, CDS 10613-11182 hypotetica proteina conservada, CDS 1401-2246 proteina hypotetica RER_01330, CDS 13161-15143 two component hystidina quinasa.

La proteina que vamos a analizar es la 3-hidroxiacyl-coA dehidrogenasa de Rhodococcus Opacus.
3-Hydroxyacyl_CoA_Dehydrogenase_Image.png
Esta proteina està implicada en la ruta del metabolismo de los lipidos y es una oxidoretuctasa.Principalmente cataliza el tercero paso de la beta ossidacion, la ossidacion de L-3-hydroxyacyl CoA by NAD+ por la cual un grupo hydroxil es convertito en un grupo quetonico.
La beta-ossidacion es una ruta metabolica que permite la degradacion de los acidos grasos con producion de acetil CoA. Està formada por una serie de cuatros reaciones y al final de estas es liberada una molecula a dos atomos de carbono acetil CoA+ 1 acil-CoA sin dos atomos de carbono. El acil-CoA luego es reintroducido en el ciclo, por cada ciclo hay formacion de 1FADH2 + 1NADH. La β-ossidaccion se para cuando el acil es todo convertido en acetil-CoA. En el caso de nuestra proteina, esta se encuentra en la tercera reaccion y reduce el NAD+ a NADH+H+, el sustrato es el producto de la reaccion que esta antes (beta hydroxiacil-CoA) de esta y se forma el
beta-quetocetil-CoA.

ACIDI_GRASSSSSSSSSSSSSSSSSSSI.gif

Dominios conservados
Los dominios conservados de esta proteina son 3HCDH C-terminal domain y NADB-Rossmann-gold NAD(P)(+)-binding protein, es una larga familia que contiene el dominio Rossmann. ()Este dominio se encuentra en dehydrogenasas de vias metabolicas como por ejemplo la glucolisis.
Este dominio es caracterizado por puentes de H y enlaces Wan der Waals.Usualmente las proteinas de esta familia contienen un segundo dominio que se anade al dominio NADB que es responsable de enlaces especificos y cataliza una especifica reacciòn enzimatica.
Click on image for an interactive view with Cn3D
Click on image for an interactive view with Cn3D

(dominio de Rossmann)

Utilizo codones
Ala:  4.000  Arg:  6.000  Asn:  2.000  Asp:  2.000  Cys:  1.000  Gln:  2.000
Glu:  2.000  Gly:  4.000  His:  2.000  Ile:  3.000  Leu:  6.000  Lys:  2.000
Met:  1.000  Phe:  2.000  Pro:  4.000  Ser:  6.000  Thr:  4.000  Trp:  1.000
Tyr:  2.000  Val:  4.000  :  2.000  :  2.000  :  3.000
external image pscale10863.gif
MIN: 2.444
MAX: 4.778
DOMINIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII.gif

Dominios Transmembrana
# Sequence Length: 282

# Sequence Number of predicted TMHs:  0
# Sequence Exp number of AAs in TMHs: 1.19571
# Sequence Exp number, first 60 AAs:  0.36396
# Sequence Total prob of N-in:        0.02536
Sequence    TMHMM2.0    outside         1   282
TRANSME.gif


Caracteristicas
El numero de aminoacidos en esta proteina es 891, el peso molecular es 73262.3 y el teoretico pI es 4.99.El porcentaje de la presencia de los diferentes aminoacidos es:Ala (A) 158 17.7%Arg (R) 0 0.0%Asn (N) 0 0.0%Asp (D) 0 0.0%Cys (C) 334 37.5%Gln (Q) 0 0.0%Glu (E) 0 0.0%Gly (G) 290 32.5%His (H) 0 0.0%Ile (I) 0 0.0%Leu (L) 0 0.0%Lys (K) 0 0.0%Met (M) 0 0.0%Phe (F) 0 0.0%Pro (P) 0 0.0%Ser (S) 0 0.0%Thr (T) 109 12.2%Trp (W) 0 0.0%Tyr (Y) 0 0.0%Val (V) 0 0.0%Pyl (O) 0 0.0%Sec (U) 0 0.0%
(B) 0 0.0% (Z) 0 0.0% (X) 0 0.0%
La composicion atomica es:Carbon C 2492Hydrogen H 4095Nitrogen N 891Oxygen O 1001Sulfur S 334
Formula: C2492H4095N891O1001S334Numero total de atomos : 8813
El coeficiente de estincion medido en agua es 20875 y las unidades son M-1 cm-1.Abs 0.1% (=1 g/l) 0.285, assumiendo que todos los residuos de Cys aparezcan coomo medias (half) cys.


Ext. coefficient 0Abs 0.1% (=1 g/l) 0.000, assumiendo que los residuos NO Cys aparezcan como cysteinas a midad.
La secuencia N-terminal es considerada como una Cys.La vida media es de 1.2 horas por mammalian reticulocytes in vitro y >20 horas in levaduras in vitro.

Primers for PCR

Usando aparatos por PCR hacemos una amplificacion de la secuencia y vemos antes los primers forward y reverse y los mas validos y eficientes.
Hay 40 forward primers validos para el contenido en GC.
Hay 66 reverse primers validos para el contenido en GC. Hay 24 forward primers validos para el range de Tm.Hay 17 reverse primers validos para el range de Tm.Hay 24 forward primers validos para los valores de anillamiento.Hay 17 reverse primers validos para los valores de anillamiento.
Hay 17 primers reverse con valores valido para el proprio anillamiento.
Algunos primers no fueron evaluados.

FORWARD-Primer AGATGAGGTATTGAAGCAGG
REVERSE-Primer CACTACTACTTTACCCTTCC
Longitud: 20 % GC: 45% Tm: 48 Tm: 42
Proprio anillamiento: 10 Proprio anillamiento: 6 Anillamiento terminal: 4 Anillamiento terminal: 0
Offset: 16 Offset: 74
Pair-anillamiento: 12
Pair-End-Anneal: 10 Total de pares de primers validos: 250
Estos primers van a amplificar un fragmento de 59 pares de bases, la secuencia de DNA que serà amplificada por estos primers es:1 AGATGAGGTA TTGAAGCAGG AGGTTGTAAA ATTGGTAAAG GAAGGGTAAA51 GTAGTAGTG

Primers Internos para PCR
Hay 40 primers forward validos en el range de contenido en GC.
Hay 66 primers reverse validos en el range de contenido en GC y 40 forward primers nel range valido de contenido en GC.
Hay 24 forward primers en el valido range de Tm.
Hay 40 primers reverse en el valido range de Tm.
Hay 24 primers forward con valores validos de anillamiento.
Hay 40 primers reverse con valores validos de proprio anillamiento.
Hay 24 primers forward con valores validos de proprio anillamiento.
Hay 40 primers reverse con validos valores de proprio anillamiento terminal.
Algunos primers no fueron evaluados.

Forward-Primer
GATGAGGTATTGAAGCAGG
Reverse-Primer ACCCTTCCTTTACCAATCC

Longitud: 19 Longitud: 19 %GC: 47 %GC: 47
Tm: 46 Tm: 49 Proprio-anillamiento: 10 Proprio anillamiento: 8
Anillamiento terminal: 4 Anillamiento terminal: 2
Offset: 17 Offset: 55
Pair-Anneal: 18Pair-End-Anneal: 10
Total de los pares de primers validos: 250
Estos primers van a amplificar fragmenstos de 39 pares de bases.
La secuencia de DNA serà amplificada por parte de estos primers
GATGAGGTAT TGAAGCAGGA
GGATTGGTAA AGGAAGGGT

PROMOTORES

Longitud de secuencia- 80 Threshold para promotores - 0.20 Numero de posibles promoters - 1 Promotor Pos: 61 LDF- 80.17 -10 box pos. 40 Score 14 -35 box pos. 21 㪠Score 21
Oligonucleotidos de sitios TF binding conocidos:
Para promotor en 61:
rpoH2: TTTTTTTT posiccion 1 Score
- 16 rpoH2: TTTTTTTT posiccion 2 Score
- 16 rpoH2: TTTTTTTT posiccion 3 Score
- 16 rpoH2: TTTTTTTT posiccion 4 Score
- 16 rpoH2: TTTTTTTT posiccion 5 Score
- 16 rpoH2: TTTTTTTT posiccion 6 Score
- 16 rpoH2: TTTTTTTT posiccion 7 Score
- 16 rpoH2: TTTTTTTT posiccion 8 Score
- 16 rpoH2: TTTTTTTT posiccion 9 Score
- 16 rpoH2: TTTTTTTT posiccion 10 Score
- 16 rpoH2: TTTTTTTT posiccion 11 Score
- 16 rpoH2: TTTTTTTT posiccion 12 Score
- 16 rpoH2: TTTTTTTT posiccion 13 Score
- 16 rpoH2: TTTTTTTT posiccion 14 Score
- 16 rpoH2: TTTTTTTT posiccion 15 Score
- 16 rpoH2: TTTTTTTT posiccion 16 Score
- 16 rpoH2: TTTTTTTT posiccion 17 Score
- 16 rpoH2: TTTTTTTT posiccion 18 Score
- 16 rpoH2: TTTTTTTT posiccion 19 Score
- 16 rpoH2: TTTTTTTT posiccion 20 Score
- 16 rpoH2: TTTTTTTT posiccion 21 Score
- 16 rpoH2: TTTTTTTT posiccion 22 Score
- 16 rpoH2: TTTTTTTT posiccion 23 Score
- 16 rpoH2: TTTTTTTT posiccion 24 Score
- 16 rpoH2: TTTTTTTT posiccion 25 Score
- 16 rpoH2: TTTTTTTT posiccion 26 Score
- 16 rpoH2: TTTTTTTT posiccion 27 Score
- 16 rpoH2: TTTTTTTT posiccion 28 Score
- 16 rpoH2: TTTTTTTT posiccion 29 Score
- 16 rpoH2: TTTTTTTT posiccion 30 Score
- 16 rpoH2: TTTTTTTT posiccion 31 Score
- 16 rpoH2: TTTTTTTT posiccion 32 Score
- 16 rpoH2: TTTTTTTT posiccion 33 Score
- 16 rpoH2: TTTTTTTT posiccion 34 Score
- 16 rpoH2: TTTTTTTT posiccion 35 Score
- 16 rpoH2: TTTTTTTT posiccion 36 Score
- 16 rpoH2: TTTTTTTT posiccion 37 Score
- 16 rpoH2: TTTTTTTT posiccion 38 Score
- 16 rpoH2: TTTTTTTT posiccion 39 Score
- 16 rpoH2: TTTTTTTT posiccion 40 Score
- 16 rpoH2: TTTTTTTT posiccion 41 Score
- 16 rpoH2: TTTTTTTT posiccion 42 Score
- 16 rpoH2: TTTTTTTT posiccion 43 Score
- 16 rpoH2: TTTTTTTT posiccion 44 Score
- 16 rpoH2: TTTTTTTT posiccion 45 Score
- 16 rpoH2: TTTTTTTT posiccion 46 Score
- 16 rpoH2: TTTTTTTT posiccion 47 Score
- 16 rpoH2: TTTTTTTT posiccion 48 Score
- 16 rpoH2: TTTTTTTT posiccion 49 Score
- 16 rpoH2: TTTTTTTT posiccion 50 Score
- 16 rpoH2: TTTTTTTT posiccion 51 Score
- 16 rpoH2: TTTTTTTT posiccion 52 Score
- 16 rpoH2: TTTTTTTT posiccion 53 Score
- 16 rpoH2: TTTTTTTT posiccion 54 Score
- 16 rpoH2: TTTTTTTT posiccion 55 Score
- 16 rpoH2: TTTTTTTT posiccion 56 Score
- 16 rpoH2: TTTTTTTT posiccion 57 Score
- 16 rpoH2: TTTTTTTT posiccion 58 Score
- 16 rpoH2: TTTTTTTT posiccion 59 Score
- 16 rpoH2: TTTTTTTT posiccion 60 Score
- 16 rpoH2: TTTTTTTT posiccion 61 Score
- 16 rpoH2: TTTTTTTT posiccion 62 Score
- 16 rpoH2: TTTTTTTT posiccion 63 Score
- 16 rpoH2: TTTTTTTT posiccion 64 Score
- 16 rpoH2: TTTTTTTT posiccion 65 Score
- 16 rpoH2: TTTTTTTT posiccion 66 Score
- 16 rpoH2: TTTTTTTT posiccion 67 Score
- 16 rpoH2: TTTTTTTT posiccion 68 Score
- 16 rpoH2: TTTTTTTT posiccion 69 Score
- 16 rpoH2: TTTTTTTT posiccion 70 Score
- 16 rpoH2: TTTTTTTT posiccion 71 Score
- 16 rpoH2: TTTTTTTT posiccion 72 Score
- 16 rpoH2: TTTTTTTT posiccion 73 Score
- 16

CONCLUSION

En este trabajo hemos encontrado que la proteina en cuestion es una proteina fundamental para este microrganismo y esto tambien lo demonstra la similaridad con otras proteinas de Rhodococcus erutropoli y, Rhodococcus Jostii .
Esto nos hace pensar que la 3-hydroxiacyl-CoA deshidrogenasa es una proteina conservada importante especialmente por lo que trata la ruta del metabolismo de los acidos grasos.

AGRADECIMIENTOS

Agradezco la Universidad de Leòn para la oportunidad de hacer este trabajo y tambien todos los profesores que nos han dato el ayuda necesaria para hacerlo y la disponibilidad para el utilizo de el laboratorio y los ordinadores con los programas bioinformaticos necesarios.
Tambien agradezco la Universidad de Teramo que en el mismo tiempo ha permitido esta colaboracion.

BIBLIOGRAFIA

-Takarada,H., Sekine,M., Hosoyama,A., Yamada,R., Fujisawa,T.Omata,S., Shimizu,A., Tsukatani,N., Tanikawa,S., Fujita,N. andHarayama,S."Comparison of the complete genome sequences of Rhodococcus erythropolis PR4 and Rhodococcus opacus B4"
- Pig heart short chain L-3-hydroxyacyl-CoA dehydrogenase revisited: sequence analysis and crystal structure determination.Protein Sci. 1999 Oct; 8(10):2010-2018
- Cloning, mapping, and expression of genes involved in the fatty acid-degradative multienzyme complex of Escherichia coli.J. Bacteriol. 1984 May; 158(2):535-542 - Structure of L-3-hydroxyacyl-coenzyme A dehydrogenase: preliminary chain tracing at 2.8-A resolution.Proc. Natl. Acad. Sci. U.S.A. 1987 Dec; 84(23):8262-8266